本章节将指导您快速入门 PIG AI 的 RAG (检索增强生成) 功能,基础篇使用【硅基流动】平台提供充足的免费调用额度,满足大多数用户的日常需求。先熟悉本章节内容,再深入研究私有化部署章节方案,一口吃不了大胖子。
| 模型类型 | 模型名称 |
|---|---|
| 聊天模型 | deepseek-ai/DeepSeek-V3 |
| 向量模型 | Qwen/Qwen3-Embedding-8B |
| 排序模型 | Qwen3-Reranker-8B |
| 视觉模型 | Qwen/Qwen2.5-VL-72B-Instruct |
推荐使用硅基流动平台获取免费的大模型 Token。该平台部署的均是开源模型,安全可信,且便于后续私有化部署。 点击访问硅基流动平台
新增模型【硅基流动】配置支持,如果发现没有对应模型名称,请更新最新的代码或者手动录入(下拉框支持手动输入)。
在模型配置页面,选择对应的模型类型并配置相关参数:
| 模型类型 | 推荐模型 |
|---|---|
| 聊天模型 | deepseek-ai/DeepSeek-V3 |
| 向量模型 | Qwen/Qwen3-Embedding-8B |
| 重排模型 | Qwen3-Reranker-8B |
| 视觉模型 | Qwen/Qwen2.5-VL-72B-Instruct |
在知识库管理页面点击新增按钮创建知识库。
在知识库管理页面选择已创建的知识库,点击上传资料。
文件处理状态说明:
| 状态 | 说明 |
|---|---|
| 未切片 | 上传文件后的状态 |
| 已切片 | 文件已经解析并切割成一段段的文本 |
| 已总结 | 通过大模型生成的整个文本的缩略信息,提高准确性 |
| 已训练(切片管理) | 通过大模型生成的文本向量并入向量库 |
上传至知识库的资料会自动切片,切片管理可以查看切片详情,点击切片即可编辑。
当右上角显示已训练的标识时,则说明文档已经调用大模型生成了切片的向量并存储到向量数据库。
在 AI 助手页面点击具体的文档库,进行针对性的问答调用。
